arxiv：2502.14892v1 [cs.cv] 2025年2月17日__

arxiv：2502.14892v1 [cs.cv] 2025年2月17日

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

arxiv：2502.14892v1 [cs.cv] 2025年2月17日

¥ 1.0

热度

应开始基于以自我为中心的流媒体视频讲话。具体地，EgoSeak从摄像头佩戴者的第一人称角度进行了演讲启动，从而准确捕获了代理商实时看到的每一刻。与第三人称或固定的摄像机视图不同，以自我为中心的观点尤其与现实世界中的代理人（例如社交机器人）尤其相关，这些机器人必须决定是否说话或保持沉默。通过利用摄像头佩戴者的直接视野（例如，面对另一个人，注意到肢体语言或凝视方向），Egospeak可以更自然地检测出微妙的线索，这些线索可以发出适当的时刻开始讲话。这对于不仅必须实时处理输入，而且在动态，多演讲者的环境中自主响应以使其显然和引人入胜的现实剂量至关重要。

添加pdf代下载 VIP点击下载文件